fix(llmobs): ensure langchain azure openai spans are not duplicate llm marked #14939

Yun-Kim · 2025-10-17T18:28:55Z

Description

This PR does 3 things:

(non-user facing) Updates our docker-compose and services.yml files to upgrade to the latest testagent version, as well as adding a env var VCR_PROVIDER_MAP value for the testagent configs.
(user-facing) fixes the langchain integration such that azure openai calls are not marked as duplicate LLM spans (if the openai integration is enabled), and instead marks them as generic workflow spans.
(non-user facing) Adds langchain tests for calling Azure OpenAI. These requires the testagent upgrade and the VCR_PROVIDER_MAP env var to allow the testagent vcr proxy to call the azure openai endpoint.

We have logic in our langchain integration to mark specific LLM calls as generic workflow spans (instead of the default llm span) if we detect the corresponding integration (for the given provider, i.e. openai/anthropic) is also enabled and will result in a downstream LLM span. Our product experience breaks if multiple spans duplicate represent an LLM call, and we were previously missing support for azure openai.

Testing

Risks

Additional Notes

…ion is enabled

github-actions · 2025-10-17T18:29:35Z

CODEOWNERS have been resolved as:

releasenotes/notes/fix-llmobs-langchain-azure-openai-e0ea489aafba7ffd.yaml  @DataDog/apm-python
tests/llmobs/llmobs_cassettes/azure_openai/azure_openai_openai_deployments_gpt-4.1-mini_chat_completions_api-version_2024-12-01-preview_post_5836d4fe.yaml  @DataDog/ml-observability
tests/llmobs/llmobs_cassettes/azure_openai/azure_openai_openai_deployments_gpt-4.1-mini_chat_completions_api-version_2024-12-01-preview_post_696c0585.yaml  @DataDog/ml-observability
.gitlab/services.yml                                                    @DataDog/python-guild @DataDog/apm-core-python
ddtrace/llmobs/_integrations/langchain.py                               @DataDog/ml-observability
docker-compose.yml                                                      @DataDog/apm-core-python
tests/contrib/langchain/test_langchain_llmobs.py                        @DataDog/ml-observability

sabrenner

lgtm, thanks for the quick fix!

ddtrace/llmobs/_integrations/langchain.py

github-actions · 2025-10-17T18:57:22Z

Bootstrap import analysis

Comparison of import times between this PR and base.

Summary

The average import time from this PR is: 242 ± 6 ms.

The average import time from base is: 242 ± 3 ms.

The import time difference between this PR and base is: 0.1 ± 0.2 ms.

The difference is not statistically significant (z = 0.44).

Import time breakdown

The following import paths have shrunk:

ddtrace.auto 1.820 ms (0.75%)

ddtrace.bootstrap.sitecustomize 1.149 ms (0.48%)

ddtrace.bootstrap.preload 1.149 ms (0.48%)

ddtrace.internal.remoteconfig.client 0.601 ms (0.25%)

ddtrace 0.670 ms (0.28%)

ddtrace.internal._unpatched 0.028 ms (0.01%)

json 0.028 ms (0.01%)

json.decoder 0.028 ms (0.01%)

re 0.028 ms (0.01%)

enum 0.028 ms (0.01%)

types 0.028 ms (0.01%)

pr-commenter · 2025-10-17T19:52:17Z

Performance SLOs

Comparing candidate yunkim/langchain-aoai (004a7db) with baseline main (18a5e9a)

📈 Performance Regressions (1 suite)

📈 iastaspectsospath - 24/24

✅ ospathbasename_aspect

Time: ✅ 4.376µs (SLO: <10.000µs 📉 -56.2%) vs baseline: +1.3%

Memory: ✅ 37.729MB (SLO: <39.000MB -3.3%) vs baseline: +4.9%

✅ ospathbasename_noaspect

Time: ✅ 1.090µs (SLO: <10.000µs 📉 -89.1%) vs baseline: -0.3%

Memory: ✅ 37.749MB (SLO: <39.000MB -3.2%) vs baseline: +5.2%

✅ ospathjoin_aspect

Time: ✅ 7.143µs (SLO: <10.000µs 📉 -28.6%) vs baseline: 📈 +14.5%

Memory: ✅ 37.670MB (SLO: <39.000MB -3.4%) vs baseline: +5.0%

✅ ospathjoin_noaspect

Time: ✅ 2.316µs (SLO: <10.000µs 📉 -76.8%) vs baseline: +0.5%

Memory: ✅ 37.631MB (SLO: <39.000MB -3.5%) vs baseline: +4.7%

✅ ospathnormcase_aspect

Time: ✅ 3.575µs (SLO: <10.000µs 📉 -64.3%) vs baseline: +0.6%

Memory: ✅ 37.670MB (SLO: <39.000MB -3.4%) vs baseline: +5.0%

✅ ospathnormcase_noaspect

Time: ✅ 0.572µs (SLO: <10.000µs 📉 -94.3%) vs baseline: -0.7%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +4.9%

✅ ospathsplit_aspect

Time: ✅ 5.007µs (SLO: <10.000µs 📉 -49.9%) vs baseline: +1.4%

Memory: ✅ 37.650MB (SLO: <39.000MB -3.5%) vs baseline: +4.7%

✅ ospathsplit_noaspect

Time: ✅ 1.597µs (SLO: <10.000µs 📉 -84.0%) vs baseline: +0.5%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

✅ ospathsplitdrive_aspect

Time: ✅ 3.779µs (SLO: <10.000µs 📉 -62.2%) vs baseline: +0.8%

Memory: ✅ 37.670MB (SLO: <39.000MB -3.4%) vs baseline: +4.8%

✅ ospathsplitdrive_noaspect

Time: ✅ 0.698µs (SLO: <10.000µs 📉 -93.0%) vs baseline: -1.5%

Memory: ✅ 37.729MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

✅ ospathsplitext_aspect

Time: ✅ 5.290µs (SLO: <10.000µs 📉 -47.1%) vs baseline: 📈 +15.4%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +4.9%

✅ ospathsplitext_noaspect

Time: ✅ 1.388µs (SLO: <10.000µs 📉 -86.1%) vs baseline: +0.2%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

🟡 Near SLO Breach (4 suites)

🟡 djangosimple - 30/30

✅ appsec

Time: ✅ 20.405ms (SLO: <22.300ms -8.5%) vs baseline: -0.1%

Memory: ✅ 65.475MB (SLO: <67.000MB -2.3%) vs baseline: +4.9%

✅ exception-replay-enabled

Time: ✅ 1.347ms (SLO: <1.450ms -7.1%) vs baseline: -0.6%

Memory: ✅ 64.508MB (SLO: <67.000MB -3.7%) vs baseline: +4.6%

✅ iast

Time: ✅ 20.362ms (SLO: <22.250ms -8.5%) vs baseline: -0.3%

Memory: ✅ 65.415MB (SLO: <67.000MB -2.4%) vs baseline: +4.7%

✅ profiler

Time: ✅ 15.257ms (SLO: <16.550ms -7.8%) vs baseline: +0.6%

Memory: ✅ 53.713MB (SLO: <54.500MB 🟡 -1.4%) vs baseline: +4.9%

✅ resource-renaming

Time: ✅ 20.498ms (SLO: <21.750ms -5.8%) vs baseline: -0.3%

Memory: ✅ 65.515MB (SLO: <67.000MB -2.2%) vs baseline: +4.9%

✅ span-code-origin

Time: ✅ 25.362ms (SLO: <28.200ms 📉 -10.1%) vs baseline: +0.3%

Memory: ✅ 67.604MB (SLO: <69.500MB -2.7%) vs baseline: +3.3%

✅ tracer

Time: ✅ 20.494ms (SLO: <21.750ms -5.8%) vs baseline: ~same

Memory: ✅ 65.445MB (SLO: <67.000MB -2.3%) vs baseline: +4.8%

✅ tracer-and-profiler

Time: ✅ 21.976ms (SLO: <23.500ms -6.5%) vs baseline: -0.2%

Memory: ✅ 66.650MB (SLO: <67.500MB 🟡 -1.3%) vs baseline: +4.8%

✅ tracer-dont-create-db-spans

Time: ✅ 19.265ms (SLO: <21.500ms 📉 -10.4%) vs baseline: -0.3%

Memory: ✅ 65.402MB (SLO: <66.000MB 🟡 -0.9%) vs baseline: +4.7%

✅ tracer-minimal

Time: ✅ 16.564ms (SLO: <17.500ms -5.3%) vs baseline: -0.5%

Memory: ✅ 65.419MB (SLO: <66.000MB 🟡 -0.9%) vs baseline: +4.7%

✅ tracer-native

Time: ✅ 20.389ms (SLO: <21.750ms -6.3%) vs baseline: -0.5%

Memory: ✅ 71.465MB (SLO: <72.500MB 🟡 -1.4%) vs baseline: +4.9%

✅ tracer-no-caches

Time: ✅ 18.366ms (SLO: <19.650ms -6.5%) vs baseline: -0.8%

Memory: ✅ 65.315MB (SLO: <67.000MB -2.5%) vs baseline: +4.6%

✅ tracer-no-databases

Time: ✅ 18.764ms (SLO: <20.100ms -6.6%) vs baseline: ~same

Memory: ✅ 65.362MB (SLO: <67.000MB -2.4%) vs baseline: +4.7%

✅ tracer-no-middleware

Time: ✅ 20.168ms (SLO: <21.500ms -6.2%) vs baseline: +0.2%

Memory: ✅ 65.326MB (SLO: <67.000MB -2.5%) vs baseline: +4.5%

✅ tracer-no-templates

Time: ✅ 20.227ms (SLO: <22.000ms -8.1%) vs baseline: -0.7%

Memory: ✅ 65.373MB (SLO: <67.000MB -2.4%) vs baseline: +4.8%

🟡 errortrackingdjangosimple - 6/6

✅ errortracking-enabled-all

Time: ✅ 18.069ms (SLO: <19.850ms -9.0%) vs baseline: ~same

Memory: ✅ 65.274MB (SLO: <66.500MB 🟡 -1.8%) vs baseline: +4.9%

✅ errortracking-enabled-user

Time: ✅ 18.036ms (SLO: <19.400ms -7.0%) vs baseline: -0.2%

Memory: ✅ 65.254MB (SLO: <66.500MB 🟡 -1.9%) vs baseline: +4.8%

✅ tracer-enabled

Time: ✅ 18.065ms (SLO: <19.450ms -7.1%) vs baseline: +0.3%

Memory: ✅ 65.313MB (SLO: <66.500MB 🟡 -1.8%) vs baseline: +5.0%

🟡 flasksimple - 18/18

✅ appsec-get

Time: ✅ 4.585ms (SLO: <4.750ms -3.5%) vs baseline: -0.2%

Memory: ✅ 61.991MB (SLO: <65.000MB -4.6%) vs baseline: +4.8%

✅ appsec-post

Time: ✅ 6.606ms (SLO: <6.750ms -2.1%) vs baseline: ~same

Memory: ✅ 61.971MB (SLO: <65.000MB -4.7%) vs baseline: +4.8%

✅ appsec-telemetry

Time: ✅ 4.576ms (SLO: <4.750ms -3.7%) vs baseline: -0.4%

Memory: ✅ 62.030MB (SLO: <65.000MB -4.6%) vs baseline: +4.9%

✅ debugger

Time: ✅ 1.855ms (SLO: <2.000ms -7.2%) vs baseline: -0.4%

Memory: ✅ 45.436MB (SLO: <47.000MB -3.3%) vs baseline: +4.6%

✅ iast-get

Time: ✅ 1.859ms (SLO: <2.000ms -7.0%) vs baseline: -0.1%

Memory: ✅ 42.349MB (SLO: <49.000MB 📉 -13.6%) vs baseline: +4.9%

✅ profiler

Time: ✅ 1.907ms (SLO: <2.100ms -9.2%) vs baseline: -0.3%

Memory: ✅ 46.537MB (SLO: <47.000MB 🟡 -1.0%) vs baseline: +5.2%

✅ resource-renaming

Time: ✅ 3.369ms (SLO: <3.650ms -7.7%) vs baseline: +0.2%

Memory: ✅ 52.298MB (SLO: <53.500MB -2.2%) vs baseline: +5.0%

✅ tracer

Time: ✅ 3.359ms (SLO: <3.650ms -8.0%) vs baseline: -0.2%

Memory: ✅ 52.298MB (SLO: <53.500MB -2.2%) vs baseline: +4.9%

✅ tracer-native

Time: ✅ 3.349ms (SLO: <3.650ms -8.2%) vs baseline: -0.1%

Memory: ✅ 58.262MB (SLO: <60.000MB -2.9%) vs baseline: +4.7%

🟡 telemetryaddmetric - 30/30

✅ 1-count-metric-1-times

Time: ✅ 2.910µs (SLO: <20.000µs 📉 -85.4%) vs baseline: -2.8%

Memory: ✅ 32.145MB (SLO: <34.000MB -5.5%) vs baseline: +5.0%

✅ 1-count-metrics-100-times

Time: ✅ 202.421µs (SLO: <220.000µs -8.0%) vs baseline: -1.2%

Memory: ✅ 32.106MB (SLO: <34.000MB -5.6%) vs baseline: +4.7%

✅ 1-distribution-metric-1-times

Time: ✅ 3.493µs (SLO: <20.000µs 📉 -82.5%) vs baseline: +5.0%

Memory: ✅ 32.047MB (SLO: <34.000MB -5.7%) vs baseline: +4.6%

✅ 1-distribution-metrics-100-times

Time: ✅ 214.416µs (SLO: <220.000µs -2.5%) vs baseline: -0.7%

Memory: ✅ 32.204MB (SLO: <34.000MB -5.3%) vs baseline: +5.4%

✅ 1-gauge-metric-1-times

Time: ✅ 2.165µs (SLO: <20.000µs 📉 -89.2%) vs baseline: -1.2%

Memory: ✅ 32.145MB (SLO: <34.000MB -5.5%) vs baseline: +4.7%

✅ 1-gauge-metrics-100-times

Time: ✅ 136.500µs (SLO: <150.000µs -9.0%) vs baseline: -0.5%

Memory: ✅ 32.165MB (SLO: <34.000MB -5.4%) vs baseline: +4.9%

✅ 1-rate-metric-1-times

Time: ✅ 3.055µs (SLO: <20.000µs 📉 -84.7%) vs baseline: -1.1%

Memory: ✅ 32.106MB (SLO: <34.000MB -5.6%) vs baseline: +4.7%

✅ 1-rate-metrics-100-times

Time: ✅ 217.185µs (SLO: <250.000µs 📉 -13.1%) vs baseline: -0.4%

Memory: ✅ 32.106MB (SLO: <34.000MB -5.6%) vs baseline: +4.6%

✅ 100-count-metrics-100-times

Time: ✅ 20.396ms (SLO: <22.000ms -7.3%) vs baseline: +0.5%

Memory: ✅ 32.126MB (SLO: <34.000MB -5.5%) vs baseline: +4.7%

✅ 100-distribution-metrics-100-times

Time: ✅ 2.282ms (SLO: <2.300ms 🟡 -0.8%) vs baseline: +0.2%

Memory: ✅ 32.126MB (SLO: <34.000MB -5.5%) vs baseline: +5.0%

✅ 100-gauge-metrics-100-times

Time: ✅ 1.420ms (SLO: <1.550ms -8.4%) vs baseline: +1.4%

Memory: ✅ 32.145MB (SLO: <34.000MB -5.5%) vs baseline: +5.1%

✅ 100-rate-metrics-100-times

Time: ✅ 2.216ms (SLO: <2.550ms 📉 -13.1%) vs baseline: -0.3%

Memory: ✅ 32.185MB (SLO: <34.000MB -5.3%) vs baseline: +5.0%

✅ flush-1-metric

Time: ✅ 4.492µs (SLO: <20.000µs 📉 -77.5%) vs baseline: -0.1%

Memory: ✅ 32.224MB (SLO: <34.000MB -5.2%) vs baseline: +5.0%

✅ flush-100-metrics

Time: ✅ 174.244µs (SLO: <250.000µs 📉 -30.3%) vs baseline: -1.5%

Memory: ✅ 32.106MB (SLO: <34.000MB -5.6%) vs baseline: +4.7%

✅ flush-1000-metrics

Time: ✅ 2.106ms (SLO: <2.500ms 📉 -15.7%) vs baseline: -1.4%

Memory: ✅ 32.932MB (SLO: <34.500MB -4.5%) vs baseline: +4.7%

⚠️ Unstable Tests (1 suite)

⚠️

coreapiscenario - 10/10 (1 unstable)

⚠️ context_with_data_listeners

Time: ⚠️ 13.263µs (SLO: <20.000µs 📉 -33.7%) vs baseline: -0.2%

Memory: ✅ 32.086MB (SLO: <33.500MB -4.2%) vs baseline: +4.8%

✅ context_with_data_no_listeners

Time: ✅ 3.282µs (SLO: <10.000µs 📉 -67.2%) vs baseline: +0.4%

Memory: ✅ 32.165MB (SLO: <33.500MB -4.0%) vs baseline: +5.0%

✅ get_item_exists

Time: ✅ 0.583µs (SLO: <10.000µs 📉 -94.2%) vs baseline: -0.2%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +5.1%

✅ get_item_missing

Time: ✅ 0.635µs (SLO: <10.000µs 📉 -93.6%) vs baseline: ~same

Memory: ✅ 32.106MB (SLO: <33.500MB -4.2%) vs baseline: +4.8%

✅ set_item

Time: ✅ 24.089µs (SLO: <30.000µs 📉 -19.7%) vs baseline: -0.8%

Memory: ✅ 32.145MB (SLO: <33.500MB -4.0%) vs baseline: +5.0%

✅ All Tests Passing (18 suites)

✅ errortrackingflasksqli - 6/6

✅ errortracking-enabled-all

Time: ✅ 2.066ms (SLO: <2.300ms 📉 -10.2%) vs baseline: -0.3%

Memory: ✅ 51.885MB (SLO: <53.500MB -3.0%) vs baseline: +4.3%

✅ errortracking-enabled-user

Time: ✅ 2.070ms (SLO: <2.250ms -8.0%) vs baseline: +0.2%

Memory: ✅ 51.885MB (SLO: <53.500MB -3.0%) vs baseline: +4.1%

✅ tracer-enabled

Time: ✅ 2.072ms (SLO: <2.300ms -9.9%) vs baseline: +0.6%

Memory: ✅ 52.003MB (SLO: <53.500MB -2.8%) vs baseline: +4.7%

✅ flasksqli - 6/6

✅ appsec-enabled

Time: ✅ 3.963ms (SLO: <4.200ms -5.6%) vs baseline: -0.2%

Memory: ✅ 62.226MB (SLO: <66.000MB -5.7%) vs baseline: +4.6%

✅ iast-enabled

Time: ✅ 2.427ms (SLO: <2.800ms 📉 -13.3%) vs baseline: -0.8%

Memory: ✅ 58.589MB (SLO: <60.000MB -2.4%) vs baseline: +4.8%

✅ tracer-enabled

Time: ✅ 2.054ms (SLO: <2.250ms -8.7%) vs baseline: -0.4%

Memory: ✅ 52.199MB (SLO: <54.500MB -4.2%) vs baseline: +5.0%

✅ httppropagationextract - 60/60

✅ all_styles_all_headers

Time: ✅ 81.915µs (SLO: <100.000µs 📉 -18.1%) vs baseline: +0.5%

Memory: ✅ 32.165MB (SLO: <33.500MB -4.0%) vs baseline: +4.7%

✅ b3_headers

Time: ✅ 14.158µs (SLO: <20.000µs 📉 -29.2%) vs baseline: +0.5%

Memory: ✅ 32.224MB (SLO: <33.500MB -3.8%) vs baseline: +4.9%

✅ b3_single_headers

Time: ✅ 13.216µs (SLO: <20.000µs 📉 -33.9%) vs baseline: -0.3%

Memory: ✅ 32.165MB (SLO: <33.500MB -4.0%) vs baseline: +4.9%

✅ datadog_tracecontext_tracestate_not_propagated_on_trace_id_no_match

Time: ✅ 64.263µs (SLO: <80.000µs 📉 -19.7%) vs baseline: +1.0%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.7%

✅ datadog_tracecontext_tracestate_propagated_on_trace_id_match

Time: ✅ 66.263µs (SLO: <80.000µs 📉 -17.2%) vs baseline: +0.1%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ empty_headers

Time: ✅ 1.607µs (SLO: <10.000µs 📉 -83.9%) vs baseline: -0.1%

Memory: ✅ 32.224MB (SLO: <33.500MB -3.8%) vs baseline: +5.0%

✅ full_t_id_datadog_headers

Time: ✅ 22.761µs (SLO: <30.000µs 📉 -24.1%) vs baseline: +0.4%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +5.0%

✅ invalid_priority_header

Time: ✅ 6.563µs (SLO: <10.000µs 📉 -34.4%) vs baseline: +1.5%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ invalid_span_id_header

Time: ✅ 6.495µs (SLO: <10.000µs 📉 -35.0%) vs baseline: +0.4%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.8%

✅ invalid_tags_header

Time: ✅ 6.529µs (SLO: <10.000µs 📉 -34.7%) vs baseline: +0.8%

Memory: ✅ 32.145MB (SLO: <33.500MB -4.0%) vs baseline: +4.7%

✅ invalid_trace_id_header

Time: ✅ 6.484µs (SLO: <10.000µs 📉 -35.2%) vs baseline: -0.4%

Memory: ✅ 32.165MB (SLO: <33.500MB -4.0%) vs baseline: +4.7%

✅ large_header_no_matches

Time: ✅ 27.589µs (SLO: <30.000µs -8.0%) vs baseline: +0.2%

Memory: ✅ 32.244MB (SLO: <33.500MB -3.8%) vs baseline: +5.0%

✅ large_valid_headers_all

Time: ✅ 28.703µs (SLO: <40.000µs 📉 -28.2%) vs baseline: ~same

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.7%

✅ medium_header_no_matches

Time: ✅ 9.878µs (SLO: <20.000µs 📉 -50.6%) vs baseline: +0.8%

Memory: ✅ 32.224MB (SLO: <33.500MB -3.8%) vs baseline: +5.0%

✅ medium_valid_headers_all

Time: ✅ 11.216µs (SLO: <20.000µs 📉 -43.9%) vs baseline: ~same

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.8%

✅ none_propagation_style

Time: ✅ 1.696µs (SLO: <10.000µs 📉 -83.0%) vs baseline: -0.4%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ tracecontext_headers

Time: ✅ 34.920µs (SLO: <40.000µs 📉 -12.7%) vs baseline: +1.4%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +5.1%

✅ valid_headers_all

Time: ✅ 6.491µs (SLO: <10.000µs 📉 -35.1%) vs baseline: +0.3%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ valid_headers_basic

Time: ✅ 6.064µs (SLO: <10.000µs 📉 -39.4%) vs baseline: +0.6%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +5.0%

✅ wsgi_empty_headers

Time: ✅ 1.598µs (SLO: <10.000µs 📉 -84.0%) vs baseline: +0.5%

Memory: ✅ 32.145MB (SLO: <33.500MB -4.0%) vs baseline: +4.9%

✅ wsgi_invalid_priority_header

Time: ✅ 6.537µs (SLO: <10.000µs 📉 -34.6%) vs baseline: ~same

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.7%

✅ wsgi_invalid_span_id_header

Time: ✅ 1.590µs (SLO: <10.000µs 📉 -84.1%) vs baseline: ~same

Memory: ✅ 32.145MB (SLO: <33.500MB -4.0%) vs baseline: +4.7%

✅ wsgi_invalid_tags_header

Time: ✅ 6.536µs (SLO: <10.000µs 📉 -34.6%) vs baseline: -0.7%

Memory: ✅ 32.244MB (SLO: <33.500MB -3.8%) vs baseline: +5.1%

✅ wsgi_invalid_trace_id_header

Time: ✅ 6.528µs (SLO: <10.000µs 📉 -34.7%) vs baseline: ~same

Memory: ✅ 32.145MB (SLO: <33.500MB -4.0%) vs baseline: +4.7%

✅ wsgi_large_header_no_matches

Time: ✅ 28.561µs (SLO: <40.000µs 📉 -28.6%) vs baseline: -0.5%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.7%

✅ wsgi_large_valid_headers_all

Time: ✅ 29.683µs (SLO: <40.000µs 📉 -25.8%) vs baseline: -0.4%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ wsgi_medium_header_no_matches

Time: ✅ 10.074µs (SLO: <20.000µs 📉 -49.6%) vs baseline: -0.4%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ wsgi_medium_valid_headers_all

Time: ✅ 11.490µs (SLO: <20.000µs 📉 -42.5%) vs baseline: -0.7%

Memory: ✅ 32.224MB (SLO: <33.500MB -3.8%) vs baseline: +5.0%

✅ wsgi_valid_headers_all

Time: ✅ 6.546µs (SLO: <10.000µs 📉 -34.5%) vs baseline: ~same

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ wsgi_valid_headers_basic

Time: ✅ 6.209µs (SLO: <10.000µs 📉 -37.9%) vs baseline: +2.0%

Memory: ✅ 32.165MB (SLO: <33.500MB -4.0%) vs baseline: +4.9%

✅ httppropagationinject - 16/16

✅ ids_only

Time: ✅ 21.626µs (SLO: <30.000µs 📉 -27.9%) vs baseline: +0.8%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ with_all

Time: ✅ 28.993µs (SLO: <40.000µs 📉 -27.5%) vs baseline: +0.8%

Memory: ✅ 32.224MB (SLO: <33.500MB -3.8%) vs baseline: +5.0%

✅ with_dd_origin

Time: ✅ 25.339µs (SLO: <30.000µs 📉 -15.5%) vs baseline: ~same

Memory: ✅ 32.126MB (SLO: <33.500MB -4.1%) vs baseline: +4.8%

✅ with_priority_and_origin

Time: ✅ 24.863µs (SLO: <40.000µs 📉 -37.8%) vs baseline: +0.9%

Memory: ✅ 32.204MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ with_sampling_priority

Time: ✅ 21.567µs (SLO: <30.000µs 📉 -28.1%) vs baseline: ~same

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.7%

✅ with_tags

Time: ✅ 27.076µs (SLO: <40.000µs 📉 -32.3%) vs baseline: +0.2%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.7%

✅ with_tags_invalid

Time: ✅ 28.620µs (SLO: <40.000µs 📉 -28.5%) vs baseline: +0.9%

Memory: ✅ 32.185MB (SLO: <33.500MB -3.9%) vs baseline: +4.9%

✅ with_tags_max_size

Time: ✅ 27.422µs (SLO: <40.000µs 📉 -31.4%) vs baseline: +0.1%

Memory: ✅ 32.165MB (SLO: <33.500MB -4.0%) vs baseline: +5.0%

✅ iast_aspects - 40/40

✅ re_expand_aspect

Time: ✅ 31.844µs (SLO: <40.000µs 📉 -20.4%) vs baseline: +0.4%

Memory: ✅ 37.729MB (SLO: <39.000MB -3.3%) vs baseline: +4.9%

✅ re_expand_noaspect

Time: ✅ 29.965µs (SLO: <40.000µs 📉 -25.1%) vs baseline: +4.4%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

✅ re_findall_aspect

Time: ✅ 2.890µs (SLO: <10.000µs 📉 -71.1%) vs baseline: +0.1%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

✅ re_findall_noaspect

Time: ✅ 1.410µs (SLO: <10.000µs 📉 -85.9%) vs baseline: -0.5%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +4.9%

✅ re_finditer_aspect

Time: ✅ 4.431µs (SLO: <10.000µs 📉 -55.7%) vs baseline: +0.2%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

✅ re_finditer_noaspect

Time: ✅ 1.408µs (SLO: <10.000µs 📉 -85.9%) vs baseline: +0.2%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

✅ re_fullmatch_aspect

Time: ✅ 2.656µs (SLO: <10.000µs 📉 -73.4%) vs baseline: ~same

Memory: ✅ 37.670MB (SLO: <39.000MB -3.4%) vs baseline: +4.9%

✅ re_fullmatch_noaspect

Time: ✅ 1.284µs (SLO: <10.000µs 📉 -87.2%) vs baseline: -0.5%

Memory: ✅ 37.670MB (SLO: <39.000MB -3.4%) vs baseline: +5.0%

✅ re_group_aspect

Time: ✅ 2.896µs (SLO: <10.000µs 📉 -71.0%) vs baseline: -2.1%

Memory: ✅ 37.650MB (SLO: <39.000MB -3.5%) vs baseline: +4.9%

✅ re_group_noaspect

Time: ✅ 1.610µs (SLO: <10.000µs 📉 -83.9%) vs baseline: -0.3%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +5.0%

✅ re_groups_aspect

Time: ✅ 3.275µs (SLO: <10.000µs 📉 -67.2%) vs baseline: +7.1%

Memory: ✅ 37.631MB (SLO: <39.000MB -3.5%) vs baseline: +4.6%

✅ re_groups_noaspect

Time: ✅ 1.703µs (SLO: <10.000µs 📉 -83.0%) vs baseline: ~same

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +4.9%

✅ re_match_aspect

Time: ✅ 2.852µs (SLO: <10.000µs 📉 -71.5%) vs baseline: +6.3%

Memory: ✅ 37.670MB (SLO: <39.000MB -3.4%) vs baseline: +5.0%

✅ re_match_noaspect

Time: ✅ 1.302µs (SLO: <10.000µs 📉 -87.0%) vs baseline: -0.3%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +4.9%

✅ re_search_aspect

Time: ✅ 2.659µs (SLO: <10.000µs 📉 -73.4%) vs baseline: +4.8%

Memory: ✅ 37.670MB (SLO: <39.000MB -3.4%) vs baseline: +4.8%

✅ re_search_noaspect

Time: ✅ 1.200µs (SLO: <10.000µs 📉 -88.0%) vs baseline: +0.3%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +4.9%

✅ re_sub_aspect

Time: ✅ 3.462µs (SLO: <10.000µs 📉 -65.4%) vs baseline: ~same

Memory: ✅ 37.650MB (SLO: <39.000MB -3.5%) vs baseline: +4.8%

✅ re_sub_noaspect

Time: ✅ 1.554µs (SLO: <10.000µs 📉 -84.5%) vs baseline: +1.6%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +4.9%

✅ re_subn_aspect

Time: ✅ 3.668µs (SLO: <10.000µs 📉 -63.3%) vs baseline: +0.4%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +5.1%

✅ re_subn_noaspect

Time: ✅ 1.601µs (SLO: <10.000µs 📉 -84.0%) vs baseline: -0.2%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +5.0%

✅ iastaspects - 118/118

✅ add_aspect

Time: ✅ 0.405µs (SLO: <10.000µs 📉 -96.0%) vs baseline: -0.7%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.9%

✅ add_inplace_aspect

Time: ✅ 0.407µs (SLO: <10.000µs 📉 -95.9%) vs baseline: -0.4%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ add_inplace_noaspect

Time: ✅ 0.317µs (SLO: <10.000µs 📉 -96.8%) vs baseline: -1.2%

Memory: ✅ 38.122MB (SLO: <39.000MB -2.3%) vs baseline: +5.2%

✅ add_noaspect

Time: ✅ 0.279µs (SLO: <10.000µs 📉 -97.2%) vs baseline: +0.7%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.8%

✅ bytearray_aspect

Time: ✅ 1.336µs (SLO: <10.000µs 📉 -86.6%) vs baseline: ~same

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +5.0%

✅ bytearray_extend_aspect

Time: ✅ 1.597µs (SLO: <10.000µs 📉 -84.0%) vs baseline: +5.0%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.9%

✅ bytearray_extend_noaspect

Time: ✅ 0.620µs (SLO: <10.000µs 📉 -93.8%) vs baseline: +1.7%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.9%

✅ bytearray_noaspect

Time: ✅ 0.484µs (SLO: <10.000µs 📉 -95.2%) vs baseline: +0.3%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.9%

✅ bytes_aspect

Time: ✅ 1.300µs (SLO: <10.000µs 📉 -87.0%) vs baseline: +0.8%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +5.0%

✅ bytes_noaspect

Time: ✅ 0.496µs (SLO: <10.000µs 📉 -95.0%) vs baseline: +0.3%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.8%

✅ bytesio_aspect

Time: ✅ 1.324µs (SLO: <10.000µs 📉 -86.8%) vs baseline: +0.3%

Memory: ✅ 38.122MB (SLO: <39.000MB -2.3%) vs baseline: +5.0%

✅ bytesio_noaspect

Time: ✅ 0.498µs (SLO: <10.000µs 📉 -95.0%) vs baseline: +0.4%

Memory: ✅ 37.985MB (SLO: <39.000MB -2.6%) vs baseline: +4.7%

✅ capitalize_aspect

Time: ✅ 0.738µs (SLO: <10.000µs 📉 -92.6%) vs baseline: -0.7%

Memory: ✅ 38.103MB (SLO: <39.000MB -2.3%) vs baseline: +4.9%

✅ capitalize_noaspect

Time: ✅ 0.434µs (SLO: <10.000µs 📉 -95.7%) vs baseline: -0.5%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ casefold_aspect

Time: ✅ 0.735µs (SLO: <10.000µs 📉 -92.6%) vs baseline: -0.9%

Memory: ✅ 38.122MB (SLO: <39.000MB -2.3%) vs baseline: +5.1%

✅ casefold_noaspect

Time: ✅ 0.372µs (SLO: <10.000µs 📉 -96.3%) vs baseline: -0.1%

Memory: ✅ 38.103MB (SLO: <39.000MB -2.3%) vs baseline: +4.9%

✅ decode_aspect

Time: ✅ 0.730µs (SLO: <10.000µs 📉 -92.7%) vs baseline: +0.7%

Memory: ✅ 37.965MB (SLO: <39.000MB -2.7%) vs baseline: +4.5%

✅ decode_noaspect

Time: ✅ 0.425µs (SLO: <10.000µs 📉 -95.7%) vs baseline: +1.3%

Memory: ✅ 38.004MB (SLO: <39.000MB -2.6%) vs baseline: +4.7%

✅ encode_aspect

Time: ✅ 0.703µs (SLO: <10.000µs 📉 -93.0%) vs baseline: -0.8%

Memory: ✅ 38.024MB (SLO: <39.000MB -2.5%) vs baseline: +4.7%

✅ encode_noaspect

Time: ✅ 0.400µs (SLO: <10.000µs 📉 -96.0%) vs baseline: -1.0%

Memory: ✅ 38.024MB (SLO: <39.000MB -2.5%) vs baseline: +4.9%

✅ format_aspect

Time: ✅ 3.356µs (SLO: <10.000µs 📉 -66.4%) vs baseline: -0.1%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.9%

✅ format_map_aspect

Time: ✅ 3.752µs (SLO: <10.000µs 📉 -62.5%) vs baseline: +5.2%

Memory: ✅ 38.122MB (SLO: <39.000MB -2.3%) vs baseline: +5.0%

✅ format_map_noaspect

Time: ✅ 0.766µs (SLO: <10.000µs 📉 -92.3%) vs baseline: -1.4%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ format_noaspect

Time: ✅ 0.597µs (SLO: <10.000µs 📉 -94.0%) vs baseline: -0.2%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +5.0%

✅ index_aspect

Time: ✅ 0.358µs (SLO: <10.000µs 📉 -96.4%) vs baseline: -0.4%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.7%

✅ index_noaspect

Time: ✅ 0.279µs (SLO: <10.000µs 📉 -97.2%) vs baseline: +0.3%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ join_aspect

Time: ✅ 1.325µs (SLO: <10.000µs 📉 -86.7%) vs baseline: -0.2%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.9%

✅ join_noaspect

Time: ✅ 0.495µs (SLO: <10.000µs 📉 -95.0%) vs baseline: +0.8%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.8%

✅ ljust_aspect

Time: ✅ 2.629µs (SLO: <20.000µs 📉 -86.9%) vs baseline: +1.0%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.9%

✅ ljust_noaspect

Time: ✅ 0.403µs (SLO: <10.000µs 📉 -96.0%) vs baseline: ~same

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +5.1%

✅ lower_aspect

Time: ✅ 2.236µs (SLO: <10.000µs 📉 -77.6%) vs baseline: -0.8%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ lower_noaspect

Time: ✅ 0.366µs (SLO: <10.000µs 📉 -96.3%) vs baseline: -0.2%

Memory: ✅ 38.103MB (SLO: <39.000MB -2.3%) vs baseline: +5.1%

✅ lstrip_aspect

Time: ✅ 2.222µs (SLO: <20.000µs 📉 -88.9%) vs baseline: ~same

Memory: ✅ 37.985MB (SLO: <39.000MB -2.6%) vs baseline: +4.5%

✅ lstrip_noaspect

Time: ✅ 0.384µs (SLO: <10.000µs 📉 -96.2%) vs baseline: +0.7%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +4.8%

✅ modulo_aspect

Time: ✅ 1.006µs (SLO: <10.000µs 📉 -89.9%) vs baseline: +0.8%

Memory: ✅ 38.004MB (SLO: <39.000MB -2.6%) vs baseline: +4.6%

✅ modulo_aspect_for_bytearray_bytearray

Time: ✅ 1.559µs (SLO: <10.000µs 📉 -84.4%) vs baseline: +1.5%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +5.0%

✅ modulo_aspect_for_bytes

Time: ✅ 0.980µs (SLO: <10.000µs 📉 -90.2%) vs baseline: -1.0%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +5.0%

✅ modulo_aspect_for_bytes_bytearray

Time: ✅ 1.210µs (SLO: <10.000µs 📉 -87.9%) vs baseline: +1.5%

Memory: ✅ 38.103MB (SLO: <39.000MB -2.3%) vs baseline: +5.0%

✅ modulo_noaspect

Time: ✅ 0.628µs (SLO: <10.000µs 📉 -93.7%) vs baseline: ~same

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +5.1%

✅ replace_aspect

Time: ✅ 4.815µs (SLO: <10.000µs 📉 -51.9%) vs baseline: -0.8%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +4.8%

✅ replace_noaspect

Time: ✅ 0.465µs (SLO: <10.000µs 📉 -95.4%) vs baseline: -0.2%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +4.8%

✅ repr_aspect

Time: ✅ 0.915µs (SLO: <10.000µs 📉 -90.8%) vs baseline: +0.7%

Memory: ✅ 38.122MB (SLO: <39.000MB -2.3%) vs baseline: +5.1%

✅ repr_noaspect

Time: ✅ 0.418µs (SLO: <10.000µs 📉 -95.8%) vs baseline: +0.9%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +4.9%

✅ rstrip_aspect

Time: ✅ 1.931µs (SLO: <20.000µs 📉 -90.3%) vs baseline: +1.2%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ rstrip_noaspect

Time: ✅ 0.381µs (SLO: <10.000µs 📉 -96.2%) vs baseline: -1.0%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +5.1%

✅ slice_aspect

Time: ✅ 0.495µs (SLO: <10.000µs 📉 -95.0%) vs baseline: -0.3%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +4.9%

✅ slice_noaspect

Time: ✅ 0.452µs (SLO: <10.000µs 📉 -95.5%) vs baseline: +1.4%

Memory: ✅ 38.103MB (SLO: <39.000MB -2.3%) vs baseline: +4.9%

✅ stringio_aspect

Time: ✅ 1.561µs (SLO: <10.000µs 📉 -84.4%) vs baseline: +0.1%

Memory: ✅ 38.004MB (SLO: <39.000MB -2.6%) vs baseline: +4.7%

✅ stringio_noaspect

Time: ✅ 0.714µs (SLO: <10.000µs 📉 -92.9%) vs baseline: -2.0%

Memory: ✅ 38.083MB (SLO: <39.000MB -2.4%) vs baseline: +4.8%

✅ strip_aspect

Time: ✅ 2.199µs (SLO: <20.000µs 📉 -89.0%) vs baseline: -0.2%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.8%

✅ strip_noaspect

Time: ✅ 0.389µs (SLO: <10.000µs 📉 -96.1%) vs baseline: ~same

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.9%

✅ swapcase_aspect

Time: ✅ 2.627µs (SLO: <10.000µs 📉 -73.7%) vs baseline: +6.0%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.8%

✅ swapcase_noaspect

Time: ✅ 0.537µs (SLO: <10.000µs 📉 -94.6%) vs baseline: ~same

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.7%

✅ title_aspect

Time: ✅ 2.411µs (SLO: <10.000µs 📉 -75.9%) vs baseline: ~same

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ title_noaspect

Time: ✅ 0.504µs (SLO: <10.000µs 📉 -95.0%) vs baseline: -0.1%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.9%

✅ translate_aspect

Time: ✅ 3.274µs (SLO: <10.000µs 📉 -67.3%) vs baseline: +0.4%

Memory: ✅ 38.063MB (SLO: <39.000MB -2.4%) vs baseline: +4.7%

✅ translate_noaspect

Time: ✅ 1.038µs (SLO: <10.000µs 📉 -89.6%) vs baseline: -0.4%

Memory: ✅ 38.044MB (SLO: <39.000MB -2.5%) vs baseline: +4.8%

✅ upper_aspect

Time: ✅ 2.261µs (SLO: <10.000µs 📉 -77.4%) vs baseline: -0.7%

Memory: ✅ 38.122MB (SLO: <39.000MB -2.3%) vs baseline: +5.0%

✅ upper_noaspect

Time: ✅ 0.372µs (SLO: <10.000µs 📉 -96.3%) vs baseline: +0.5%

Memory: ✅ 38.024MB (SLO: <39.000MB -2.5%) vs baseline: +4.6%

✅ iastaspectssplit - 12/12

✅ rsplit_aspect

Time: ✅ 1.389µs (SLO: <10.000µs 📉 -86.1%) vs baseline: -1.4%

Memory: ✅ 37.650MB (SLO: <39.000MB -3.5%) vs baseline: +4.8%

✅ rsplit_noaspect

Time: ✅ 0.577µs (SLO: <10.000µs 📉 -94.2%) vs baseline: -0.5%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +5.1%

✅ split_aspect

Time: ✅ 1.391µs (SLO: <10.000µs 📉 -86.1%) vs baseline: +0.7%

Memory: ✅ 37.611MB (SLO: <39.000MB -3.6%) vs baseline: +4.6%

✅ split_noaspect

Time: ✅ 0.574µs (SLO: <10.000µs 📉 -94.3%) vs baseline: +0.4%

Memory: ✅ 37.709MB (SLO: <39.000MB -3.3%) vs baseline: +4.8%

✅ splitlines_aspect

Time: ✅ 1.381µs (SLO: <10.000µs 📉 -86.2%) vs baseline: -1.3%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +4.9%

✅ splitlines_noaspect

Time: ✅ 0.590µs (SLO: <10.000µs 📉 -94.1%) vs baseline: +1.2%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +5.0%

✅ iastpropagation - 2/2

✅ no-propagation

Time: ✅ 49.320µs (SLO: <60.000µs 📉 -17.8%) vs baseline: +0.1%

Memory: ✅ 37.690MB (SLO: <39.000MB -3.4%) vs baseline: +4.9%

✅ otelsdkspan - 24/24

✅ add-event

Time: ✅ 40.402ms (SLO: <42.000ms -3.8%) vs baseline: +0.4%

Memory: ✅ 34.524MB (SLO: <39.000MB 📉 -11.5%) vs baseline: +4.5%

✅ add-link

Time: ✅ 36.259ms (SLO: <38.550ms -5.9%) vs baseline: -0.1%

Memory: ✅ 34.524MB (SLO: <39.000MB 📉 -11.5%) vs baseline: +4.7%

✅ add-metrics

Time: ✅ 218.992ms (SLO: <232.000ms -5.6%) vs baseline: +0.3%

Memory: ✅ 34.918MB (SLO: <39.000MB 📉 -10.5%) vs baseline: +5.9%

✅ add-tags

Time: ✅ 210.009ms (SLO: <221.600ms -5.2%) vs baseline: -0.8%

Memory: ✅ 34.583MB (SLO: <39.000MB 📉 -11.3%) vs baseline: +4.5%

✅ get-context

Time: ✅ 29.090ms (SLO: <31.300ms -7.1%) vs baseline: ~same

Memory: ✅ 34.583MB (SLO: <39.000MB 📉 -11.3%) vs baseline: +4.9%

✅ is-recording

Time: ✅ 29.046ms (SLO: <31.000ms -6.3%) vs baseline: -0.2%

Memory: ✅ 34.505MB (SLO: <39.000MB 📉 -11.5%) vs baseline: +4.7%

✅ record-exception

Time: ✅ 63.281ms (SLO: <65.850ms -3.9%) vs baseline: +0.3%

Memory: ✅ 34.937MB (SLO: <39.000MB 📉 -10.4%) vs baseline: +4.9%

✅ set-status

Time: ✅ 31.919ms (SLO: <34.150ms -6.5%) vs baseline: +0.2%

Memory: ✅ 34.524MB (SLO: <39.000MB 📉 -11.5%) vs baseline: +4.8%

✅ start

Time: ✅ 28.776ms (SLO: <30.150ms -4.6%) vs baseline: +1.0%

Memory: ✅ 34.544MB (SLO: <39.000MB 📉 -11.4%) vs baseline: +4.9%

✅ start-finish

Time: ✅ 33.852ms (SLO: <35.350ms -4.2%) vs baseline: -0.8%

Memory: ✅ 34.564MB (SLO: <39.000MB 📉 -11.4%) vs baseline: +4.9%

✅ start-finish-telemetry

Time: ✅ 34.136ms (SLO: <35.450ms -3.7%) vs baseline: +0.5%

Memory: ✅ 34.564MB (SLO: <39.000MB 📉 -11.4%) vs baseline: +4.0%

✅ update-name

Time: ✅ 31.099ms (SLO: <33.400ms -6.9%) vs baseline: ~same

Memory: ✅ 34.524MB (SLO: <39.000MB 📉 -11.5%) vs baseline: +4.7%

✅ otelspan - 22/22

✅ add-event

Time: ✅ 40.623ms (SLO: <47.150ms 📉 -13.8%) vs baseline: +1.3%

Memory: ✅ 43.812MB (SLO: <47.000MB -6.8%) vs baseline: +4.9%

✅ add-metrics

Time: ✅ 318.923ms (SLO: <344.800ms -7.5%) vs baseline: +0.9%

Memory: ✅ 651.551MB (SLO: <675.000MB -3.5%) vs baseline: +4.7%

✅ add-tags

Time: ✅ 287.605ms (SLO: <314.000ms -8.4%) vs baseline: -0.9%

Memory: ✅ 653.734MB (SLO: <675.000MB -3.2%) vs baseline: +4.9%

✅ get-context

Time: ✅ 79.951ms (SLO: <92.350ms 📉 -13.4%) vs baseline: ~same

Memory: ✅ 39.629MB (SLO: <46.500MB 📉 -14.8%) vs baseline: +4.8%

✅ is-recording

Time: ✅ 38.024ms (SLO: <44.500ms 📉 -14.6%) vs baseline: +0.3%

Memory: ✅ 43.220MB (SLO: <47.500MB -9.0%) vs baseline: +5.1%

✅ record-exception

Time: ✅ 58.119ms (SLO: <67.650ms 📉 -14.1%) vs baseline: +0.6%

Memory: ✅ 39.891MB (SLO: <47.000MB 📉 -15.1%) vs baseline: +4.8%

✅ set-status

Time: ✅ 43.848ms (SLO: <50.400ms 📉 -13.0%) vs baseline: ~same

Memory: ✅ 43.215MB (SLO: <47.000MB -8.1%) vs baseline: +4.9%

✅ start

Time: ✅ 37.256ms (SLO: <43.450ms 📉 -14.3%) vs baseline: -0.2%

Memory: ✅ 43.170MB (SLO: <47.000MB -8.1%) vs baseline: +4.9%

✅ start-finish

Time: ✅ 81.863ms (SLO: <88.000ms -7.0%) vs baseline: -0.5%

Memory: ✅ 34.603MB (SLO: <46.500MB 📉 -25.6%) vs baseline: +4.8%

✅ start-finish-telemetry

Time: ✅ 83.535ms (SLO: <89.000ms -6.1%) vs baseline: -0.1%

Memory: ✅ 34.623MB (SLO: <46.500MB 📉 -25.5%) vs baseline: +5.2%

✅ update-name

Time: ✅ 38.750ms (SLO: <45.150ms 📉 -14.2%) vs baseline: +0.3%

Memory: ✅ 43.452MB (SLO: <47.000MB -7.5%) vs baseline: +4.7%

✅ packagespackageforrootmodulemapping - 4/4

✅ cache_off

Time: ✅ 341.717ms (SLO: <354.300ms -3.6%) vs baseline: -0.3%

Memory: ✅ 37.651MB (SLO: <40.000MB -5.9%) vs baseline: +4.1%

✅ cache_on

Time: ✅ 0.387µs (SLO: <10.000µs 📉 -96.1%) vs baseline: +1.9%

Memory: ✅ 36.991MB (SLO: <39.000MB -5.2%) vs baseline: +4.8%

✅ packagesupdateimporteddependencies - 24/24

✅ import_many

Time: ✅ 154.999µs (SLO: <170.000µs -8.8%) vs baseline: ~same

Memory: ✅ 36.823MB (SLO: <38.500MB -4.4%) vs baseline: +4.6%

✅ import_many_cached

Time: ✅ 121.601µs (SLO: <130.000µs -6.5%) vs baseline: +0.2%

Memory: ✅ 36.787MB (SLO: <38.500MB -4.4%) vs baseline: +4.7%

✅ import_many_stdlib

Time: ✅ 1.623ms (SLO: <1.750ms -7.2%) vs baseline: -0.5%

Memory: ✅ 37.173MB (SLO: <38.500MB -3.4%) vs baseline: +4.9%

✅ import_many_stdlib_cached

Time: ✅ 0.973ms (SLO: <1.100ms 📉 -11.6%) vs baseline: -1.2%

Memory: ✅ 37.136MB (SLO: <38.500MB -3.5%) vs baseline: +5.7%

✅ import_many_unknown

Time: ✅ 834.843µs (SLO: <890.000µs -6.2%) vs baseline: +0.8%

Memory: ✅ 37.052MB (SLO: <38.500MB -3.8%) vs baseline: +4.4%

✅ import_many_unknown_cached

Time: ✅ 789.298µs (SLO: <870.000µs -9.3%) vs baseline: -0.2%

Memory: ✅ 36.712MB (SLO: <38.500MB -4.6%) vs baseline: +4.8%

✅ import_one

Time: ✅ 19.669µs (SLO: <30.000µs 📉 -34.4%) vs baseline: -0.3%

Memory: ✅ 36.931MB (SLO: <39.000MB -5.3%) vs baseline: +6.0%

✅ import_one_cache

Time: ✅ 6.244µs (SLO: <10.000µs 📉 -37.6%) vs baseline: -0.8%

Memory: ✅ 36.942MB (SLO: <38.500MB -4.0%) vs baseline: +5.6%

✅ import_one_stdlib

Time: ✅ 18.650µs (SLO: <20.000µs -6.8%) vs baseline: -0.7%

Memory: ✅ 36.904MB (SLO: <38.500MB -4.1%) vs baseline: +5.8%

✅ import_one_stdlib_cache

Time: ✅ 6.285µs (SLO: <10.000µs 📉 -37.1%) vs baseline: -0.5%

Memory: ✅ 36.605MB (SLO: <38.500MB -4.9%) vs baseline: +4.1%

✅ import_one_unknown

Time: ✅ 45.218µs (SLO: <50.000µs -9.6%) vs baseline: -0.4%

Memory: ✅ 36.596MB (SLO: <38.500MB -4.9%) vs baseline: +4.7%

✅ import_one_unknown_cache

Time: ✅ 6.316µs (SLO: <10.000µs 📉 -36.8%) vs baseline: +0.6%

Memory: ✅ 36.584MB (SLO: <38.500MB -5.0%) vs baseline: +4.2%

✅ ratelimiter - 12/12

✅ defaults

Time: ✅ 2.353µs (SLO: <10.000µs 📉 -76.5%) vs baseline: ~same

Memory: ✅ 31.792MB (SLO: <34.000MB -6.5%) vs baseline: +4.7%

✅ high_rate_limit

Time: ✅ 2.403µs (SLO: <10.000µs 📉 -76.0%) vs baseline: ~same

Memory: ✅ 31.674MB (SLO: <34.000MB -6.8%) vs baseline: +4.5%

✅ long_window

Time: ✅ 2.340µs (SLO: <10.000µs 📉 -76.6%) vs baseline: -0.5%

Memory: ✅ 31.752MB (SLO: <34.000MB -6.6%) vs baseline: +4.9%

✅ low_rate_limit

Time: ✅ 2.348µs (SLO: <10.000µs 📉 -76.5%) vs baseline: -0.8%

Memory: ✅ 31.811MB (SLO: <34.000MB -6.4%) vs baseline: +4.9%

✅ no_rate_limit

Time: ✅ 0.831µs (SLO: <10.000µs 📉 -91.7%) vs baseline: +0.9%

Memory: ✅ 31.752MB (SLO: <34.000MB -6.6%) vs baseline: +4.9%

✅ short_window

Time: ✅ 2.489µs (SLO: <10.000µs 📉 -75.1%) vs baseline: +0.3%

Memory: ✅ 31.772MB (SLO: <34.000MB -6.6%) vs baseline: +4.9%

✅ recursivecomputation - 8/8

✅ deep

Time: ✅ 310.064ms (SLO: <320.950ms -3.4%) vs baseline: +0.5%

Memory: ✅ 32.932MB (SLO: <34.500MB -4.5%) vs baseline: +4.9%

✅ deep-profiled

Time: ✅ 327.865ms (SLO: <359.150ms -8.7%) vs baseline: -0.1%

Memory: ✅ 37.238MB (SLO: <39.000MB -4.5%) vs baseline: +4.7%

✅ medium

Time: ✅ 7.048ms (SLO: <7.400ms -4.8%) vs baseline: +0.2%

Memory: ✅ 32.165MB (SLO: <34.000MB -5.4%) vs baseline: +4.9%

✅ shallow

Time: ✅ 0.946ms (SLO: <1.050ms -9.9%) vs baseline: -0.5%

Memory: ✅ 32.126MB (SLO: <34.000MB -5.5%) vs baseline: +4.9%

✅ samplingrules - 8/8

✅ average_match

Time: ✅ 137.349µs (SLO: <290.000µs 📉 -52.6%) vs baseline: -0.9%

Memory: ✅ 32.106MB (SLO: <34.000MB -5.6%) vs baseline: +4.7%

✅ high_match

Time: ✅ 173.425µs (SLO: <480.000µs 📉 -63.9%) vs baseline: -1.1%

Memory: ✅ 32.126MB (SLO: <34.000MB -5.5%) vs baseline: +4.8%

✅ low_match

Time: ✅ 98.973µs (SLO: <120.000µs 📉 -17.5%) vs baseline: +0.4%

Memory: ✅ 600.879MB (SLO: <700.000MB 📉 -14.2%) vs baseline: +4.9%

✅ very_low_match

Time: ✅ 2.647ms (SLO: <8.500ms 📉 -68.9%) vs baseline: -1.2%

Memory: ✅ 68.282MB (SLO: <75.000MB -9.0%) vs baseline: +4.8%

✅ sethttpmeta - 32/32

✅ all-disabled

Time: ✅ 10.748µs (SLO: <20.000µs 📉 -46.3%) vs baseline: +2.4%

Memory: ✅ 32.539MB (SLO: <34.000MB -4.3%) vs baseline: +4.7%

✅ all-enabled

Time: ✅ 40.842µs (SLO: <50.000µs 📉 -18.3%) vs baseline: +2.6%

Memory: ✅ 32.578MB (SLO: <34.000MB -4.2%) vs baseline: +5.0%

✅ collectipvariant_exists

Time: ✅ 40.641µs (SLO: <50.000µs 📉 -18.7%) vs baseline: ~same

Memory: ✅ 32.539MB (SLO: <34.000MB -4.3%) vs baseline: +4.8%

✅ no-collectipvariant

Time: ✅ 40.011µs (SLO: <50.000µs 📉 -20.0%) vs baseline: ~same

Memory: ✅ 32.539MB (SLO: <34.000MB -4.3%) vs baseline: +4.7%

✅ no-useragentvariant

Time: ✅ 38.481µs (SLO: <50.000µs 📉 -23.0%) vs baseline: -0.5%

Memory: ✅ 32.558MB (SLO: <34.000MB -4.2%) vs baseline: +5.0%

✅ obfuscation-no-query

Time: ✅ 40.310µs (SLO: <50.000µs 📉 -19.4%) vs baseline: -0.3%

Memory: ✅ 32.578MB (SLO: <34.000MB -4.2%) vs baseline: +4.9%

✅ obfuscation-regular-case-explicit-query

Time: ✅ 76.902µs (SLO: <90.000µs 📉 -14.6%) vs baseline: +1.6%

Memory: ✅ 32.932MB (SLO: <34.000MB -3.1%) vs baseline: +4.7%

✅ obfuscation-regular-case-implicit-query

Time: ✅ 77.589µs (SLO: <90.000µs 📉 -13.8%) vs baseline: +1.9%

Memory: ✅ 32.952MB (SLO: <34.000MB -3.1%) vs baseline: +4.7%

✅ obfuscation-send-querystring-disabled

Time: ✅ 155.372µs (SLO: <170.000µs -8.6%) vs baseline: +0.7%

Memory: ✅ 32.952MB (SLO: <34.500MB -4.5%) vs baseline: +4.9%

✅ obfuscation-worst-case-explicit-query

Time: ✅ 148.642µs (SLO: <160.000µs -7.1%) vs baseline: ~same

Memory: ✅ 32.893MB (SLO: <34.500MB -4.7%) vs baseline: +4.6%

✅ obfuscation-worst-case-implicit-query

Time: ✅ 154.907µs (SLO: <170.000µs -8.9%) vs baseline: ~same

Memory: ✅ 32.971MB (SLO: <34.500MB -4.4%) vs baseline: +5.0%

✅ useragentvariant_exists_1

Time: ✅ 39.555µs (SLO: <50.000µs 📉 -20.9%) vs baseline: +0.5%

Memory: ✅ 32.519MB (SLO: <34.000MB -4.4%) vs baseline: +4.8%

✅ useragentvariant_exists_2

Time: ✅ 40.702µs (SLO: <50.000µs 📉 -18.6%) vs baseline: +0.5%

Memory: ✅ 32.558MB (SLO: <34.000MB -4.2%) vs baseline: +4.8%

✅ useragentvariant_exists_3

Time: ✅ 40.649µs (SLO: <50.000µs 📉 -18.7%) vs baseline: +1.7%

Memory: ✅ 32.578MB (SLO: <34.000MB -4.2%) vs baseline: +5.0%

✅ useragentvariant_not_exists_1

Time: ✅ 39.399µs (SLO: <50.000µs 📉 -21.2%) vs baseline: +0.4%

Memory: ✅ 32.499MB (SLO: <34.000MB -4.4%) vs baseline: +4.5%

✅ useragentvariant_not_exists_2

Time: ✅ 40.172µs (SLO: <50.000µs 📉 -19.7%) vs baseline: +2.1%

Memory: ✅ 32.558MB (SLO: <34.000MB -4.2%) vs baseline: +4.9%

✅ span - 26/26

✅ add-event

Time: ✅ 19.949ms (SLO: <22.500ms 📉 -11.3%) vs baseline: -0.3%

Memory: ✅ 48.776MB (SLO: <53.000MB -8.0%) vs baseline: +4.9%

✅ add-metrics

Time: ✅ 89.965ms (SLO: <93.500ms -3.8%) vs baseline: -0.1%

Memory: ✅ 735.297MB (SLO: <961.000MB 📉 -23.5%) vs baseline: +4.8%

✅ add-tags

Time: ✅ 146.846ms (SLO: <155.000ms -5.3%) vs baseline: ~same

Memory: ✅ 736.265MB (SLO: <962.500MB 📉 -23.5%) vs baseline: +4.9%

✅ get-context

Time: ✅ 18.260ms (SLO: <20.500ms 📉 -10.9%) vs baseline: -0.6%

Memory: ✅ 47.451MB (SLO: <53.000MB 📉 -10.5%) vs baseline: +4.8%

✅ is-recording

Time: ✅ 18.555ms (SLO: <20.500ms -9.5%) vs baseline: -0.5%

Memory: ✅ 47.515MB (SLO: <53.000MB 📉 -10.3%) vs baseline: +4.9%

✅ record-exception

Time: ✅ 37.261ms (SLO: <40.000ms -6.8%) vs baseline: ~same

Memory: ✅ 41.941MB (SLO: <53.000MB 📉 -20.9%) vs baseline: +4.7%

✅ set-status

Time: ✅ 20.028ms (SLO: <22.000ms -9.0%) vs baseline: -1.2%

Memory: ✅ 47.543MB (SLO: <53.000MB 📉 -10.3%) vs baseline: +4.9%

✅ start

Time: ✅ 18.174ms (SLO: <20.500ms 📉 -11.3%) vs baseline: -0.3%

Memory: ✅ 47.458MB (SLO: <53.000MB 📉 -10.5%) vs baseline: +4.6%

✅ start-finish

Time: ✅ 50.870ms (SLO: <52.500ms -3.1%) vs baseline: +0.6%

Memory: ✅ 32.106MB (SLO: <34.000MB -5.6%) vs baseline: +4.7%

✅ start-finish-telemetry

Time: ✅ 51.911ms (SLO: <54.500ms -4.7%) vs baseline: ~same

Memory: ✅ 32.165MB (SLO: <34.000MB -5.4%) vs baseline: +4.9%

✅ start-finish-traceid128

Time: ✅ 54.820ms (SLO: <57.000ms -3.8%) vs baseline: +1.6%

Memory: ✅ 32.126MB (SLO: <34.000MB -5.5%) vs baseline: +4.9%

✅ start-traceid128

Time: ✅ 18.601ms (SLO: <22.500ms 📉 -17.3%) vs baseline: +0.6%

Memory: ✅ 47.519MB (SLO: <53.000MB 📉 -10.3%) vs baseline: +4.7%

✅ update-name

Time: ✅ 18.725ms (SLO: <22.000ms 📉 -14.9%) vs baseline: +0.6%

Memory: ✅ 48.221MB (SLO: <53.000MB -9.0%) vs baseline: +4.9%

✅ tracer - 6/6

✅ large

Time: ✅ 29.484ms (SLO: <32.950ms 📉 -10.5%) vs baseline: -0.7%

Memory: ✅ 32.893MB (SLO: <34.500MB -4.7%) vs baseline: +3.4%

✅ medium

Time: ✅ 2.956ms (SLO: <3.200ms -7.6%) vs baseline: +0.4%

Memory: ✅ 32.106MB (SLO: <34.000MB -5.6%) vs baseline: +4.9%

✅ small

Time: ✅ 330.245µs (SLO: <370.000µs 📉 -10.7%) vs baseline: ~same

Memory: ✅ 32.165MB (SLO: <34.000MB -5.4%) vs baseline: +4.7%

ℹ️ Scenarios Missing SLO Configuration (9 scenarios)

The following scenarios exist in candidate data but have no SLO thresholds configured:

coreapiscenario-core_dispatch_listeners
coreapiscenario-core_dispatch_no_listeners
coreapiscenario-core_dispatch_with_results_listeners
coreapiscenario-core_dispatch_with_results_no_listeners
djangosimple-baseline
errortrackingdjangosimple-baseline
errortrackingflasksqli-baseline
flasksimple-baseline
flasksqli-baseline

…m marked (#14939) [MLOB-4230] ## Description This PR does 3 things: 1. (non-user facing) Updates our docker-compose and services.yml files to upgrade to the latest testagent version, as well as adding a env var `VCR_PROVIDER_MAP` value for the testagent configs. 2. (user-facing) fixes the langchain integration such that azure openai calls are not marked as duplicate LLM spans (if the openai integration is enabled), and instead marks them as generic workflow spans. 3. (non-user facing) Adds langchain tests for calling Azure OpenAI. These requires the testagent upgrade and the `VCR_PROVIDER_MAP` env var to allow the testagent vcr proxy to call the azure openai endpoint. We have logic in our langchain integration to mark specific LLM calls as generic workflow spans (instead of the default llm span) if we detect the corresponding integration (for the given provider, i.e. `openai/anthropic`) is also enabled and will result in a downstream LLM span. Our product experience breaks if multiple spans duplicate represent an LLM call, and we were previously missing support for azure openai.  ## Testing  ## Risks  ## Additional Notes  [MLOB-4230]: https://datadoghq.atlassian.net/browse/MLOB-4230?atlOrigin=eyJpIjoiNWRkNTljNzYxNjVmNDY3MDlhMDU5Y2ZhYzA5YTRkZjUiLCJwIjoiZ2l0aHViLWNvbS1KU1cifQ (cherry picked from commit 9f7d187)

…m marked (#14939) [MLOB-4230] This PR does 3 things: 1. (non-user facing) Updates our docker-compose and services.yml files to upgrade to the latest testagent version, as well as adding a env var `VCR_PROVIDER_MAP` value for the testagent configs. 2. (user-facing) fixes the langchain integration such that azure openai calls are not marked as duplicate LLM spans (if the openai integration is enabled), and instead marks them as generic workflow spans. 3. (non-user facing) Adds langchain tests for calling Azure OpenAI. These requires the testagent upgrade and the `VCR_PROVIDER_MAP` env var to allow the testagent vcr proxy to call the azure openai endpoint. We have logic in our langchain integration to mark specific LLM calls as generic workflow spans (instead of the default llm span) if we detect the corresponding integration (for the given provider, i.e. `openai/anthropic`) is also enabled and will result in a downstream LLM span. Our product experience breaks if multiple spans duplicate represent an LLM call, and we were previously missing support for azure openai.     [MLOB-4230]: https://datadoghq.atlassian.net/browse/MLOB-4230?atlOrigin=eyJpIjoiNWRkNTljNzYxNjVmNDY3MDlhMDU5Y2ZhYzA5YTRkZjUiLCJwIjoiZ2l0aHViLWNvbS1KU1cifQ (cherry picked from commit 9f7d187)

…m marked (#14939) [MLOB-4230] ## Description This PR does 3 things: 1. (non-user facing) Updates our docker-compose and services.yml files to upgrade to the latest testagent version, as well as adding a env var `VCR_PROVIDER_MAP` value for the testagent configs. 2. (user-facing) fixes the langchain integration such that azure openai calls are not marked as duplicate LLM spans (if the openai integration is enabled), and instead marks them as generic workflow spans. 3. (non-user facing) Adds langchain tests for calling Azure OpenAI. These requires the testagent upgrade and the `VCR_PROVIDER_MAP` env var to allow the testagent vcr proxy to call the azure openai endpoint. We have logic in our langchain integration to mark specific LLM calls as generic workflow spans (instead of the default llm span) if we detect the corresponding integration (for the given provider, i.e. `openai/anthropic`) is also enabled and will result in a downstream LLM span. Our product experience breaks if multiple spans duplicate represent an LLM call, and we were previously missing support for azure openai.  ## Testing  ## Risks  ## Additional Notes  [MLOB-4230]: https://datadoghq.atlassian.net/browse/MLOB-4230?atlOrigin=eyJpIjoiNWRkNTljNzYxNjVmNDY3MDlhMDU5Y2ZhYzA5YTRkZjUiLCJwIjoiZ2l0aHViLWNvbS1KU1cifQ (cherry picked from commit 9f7d187)

…m marked (#14939) [MLOB-4230] This PR does 3 things: 1. (non-user facing) Updates our docker-compose and services.yml files to upgrade to the latest testagent version, as well as adding a env var `VCR_PROVIDER_MAP` value for the testagent configs. 2. (user-facing) fixes the langchain integration such that azure openai calls are not marked as duplicate LLM spans (if the openai integration is enabled), and instead marks them as generic workflow spans. 3. (non-user facing) Adds langchain tests for calling Azure OpenAI. These requires the testagent upgrade and the `VCR_PROVIDER_MAP` env var to allow the testagent vcr proxy to call the azure openai endpoint. We have logic in our langchain integration to mark specific LLM calls as generic workflow spans (instead of the default llm span) if we detect the corresponding integration (for the given provider, i.e. `openai/anthropic`) is also enabled and will result in a downstream LLM span. Our product experience breaks if multiple spans duplicate represent an LLM call, and we were previously missing support for azure openai.     [MLOB-4230]: https://datadoghq.atlassian.net/browse/MLOB-4230?atlOrigin=eyJpIjoiNWRkNTljNzYxNjVmNDY3MDlhMDU5Y2ZhYzA5YTRkZjUiLCJwIjoiZ2l0aHViLWNvbS1KU1cifQ (cherry picked from commit 9f7d187)

ensure langchain aoai spans are marked as workflow if openai integrat…

6b8f523

…ion is enabled

Yun-Kim requested review from a team as code owners October 17, 2025 18:28

Yun-Kim requested review from avara1986 and emmettbutler October 17, 2025 18:28

sabrenner approved these changes Oct 17, 2025

View reviewed changes

ddtrace/llmobs/_integrations/langchain.py Outdated Show resolved Hide resolved

More generic provider checking

732bfa0

juanjux approved these changes Oct 20, 2025

View reviewed changes

Yun-Kim enabled auto-merge (squash) October 20, 2025 14:55

Yun-Kim added the backport 3.16 label Oct 20, 2025

Merge branch 'main' into yunkim/langchain-aoai

fd746af

emmettbutler approved these changes Oct 20, 2025

View reviewed changes

Yun-Kim added 2 commits October 21, 2025 13:00

Merge branch 'main' into yunkim/langchain-aoai

5cdb9c8

Merge branch 'main' into yunkim/langchain-aoai

004a7db

Yun-Kim merged commit 9f7d187 into main Oct 22, 2025
1002 of 1005 checks passed

Yun-Kim deleted the yunkim/langchain-aoai branch October 22, 2025 15:33

dd-octo-sts bot mentioned this pull request Oct 22, 2025

fix(llmobs): ensure langchain azure openai spans are not duplicate llm marked [backport 3.16] #14990

Open

Yun-Kim added the backport 3.17 label Oct 23, 2025

dd-octo-sts bot mentioned this pull request Oct 23, 2025

fix(llmobs): ensure langchain azure openai spans are not duplicate llm marked [backport 3.17] #15014

Open

fix(llmobs): ensure langchain azure openai spans are not duplicate llm marked #14939

fix(llmobs): ensure langchain azure openai spans are not duplicate llm marked #14939

Conversation

Yun-Kim commented Oct 17, 2025 • edited by atlassian bot Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Description

Testing

Risks

Additional Notes

Uh oh!

github-actions bot commented Oct 17, 2025

Uh oh!

sabrenner left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

github-actions bot commented Oct 17, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Bootstrap import analysis

Summary

Import time breakdown

Uh oh!

pr-commenter bot commented Oct 17, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Performance SLOs

✅ ospathbasename_aspect

✅ ospathbasename_noaspect

✅ ospathjoin_aspect

✅ ospathjoin_noaspect

✅ ospathnormcase_aspect

✅ ospathnormcase_noaspect

✅ ospathsplit_aspect

✅ ospathsplit_noaspect

✅ ospathsplitdrive_aspect

✅ ospathsplitdrive_noaspect

✅ ospathsplitext_aspect

✅ ospathsplitext_noaspect

✅ appsec

✅ exception-replay-enabled

✅ iast

✅ profiler

✅ resource-renaming

✅ span-code-origin

✅ tracer

✅ tracer-and-profiler

✅ tracer-dont-create-db-spans

✅ tracer-minimal

✅ tracer-native

✅ tracer-no-caches

✅ tracer-no-databases

✅ tracer-no-middleware

✅ tracer-no-templates

✅ errortracking-enabled-all

✅ errortracking-enabled-user

✅ tracer-enabled

✅ appsec-get

✅ appsec-post

✅ appsec-telemetry

✅ debugger

✅ iast-get

✅ profiler

✅ resource-renaming

✅ tracer

✅ tracer-native

✅ 1-count-metric-1-times

✅ 1-count-metrics-100-times

✅ 1-distribution-metric-1-times

✅ 1-distribution-metrics-100-times

✅ 1-gauge-metric-1-times

✅ 1-gauge-metrics-100-times

✅ 1-rate-metric-1-times

✅ 1-rate-metrics-100-times

✅ 100-count-metrics-100-times

✅ 100-distribution-metrics-100-times

✅ 100-gauge-metrics-100-times

✅ 100-rate-metrics-100-times

✅ flush-1-metric

✅ flush-100-metrics

✅ flush-1000-metrics

⚠️ context_with_data_listeners

Yun-Kim commented Oct 17, 2025 •

edited by atlassian bot

Loading

github-actions bot commented Oct 17, 2025 •

edited

Loading

pr-commenter bot commented Oct 17, 2025 •

edited

Loading